Información Estadística de número de empresas del sector privado distribuidos por distritos mensualmente en el año 2021.
Fuente: Superintendencia Nacional de Aduanas y de Administración Tributaria (SUNAT)
El marco principal de datos de dicha información tiene 1369 filas y 14 variables:
Ubigeo: factor con 1369 niveles
DISTRITOS: factor con 1369 niveles
ENERO: Número de empresas del sector privado en Enero 2021
FEBRERO: Número de empresas del sector privado en Febrero 2021
MARZO: Número de empresas del sector privado en Marzo 2021
ABRIL: Número de empresas del sector privado en Abril 2021
MAYO: Número de empresas del sector privado en Mayo 2021
JUNIO: Número de empresas del sector privado en Junio 2021
JULIO: Número de empresas del sector privado en Julio 2021
AGOSTO: Número de empresas del sector privado en Agosto 2021
SETIEMBRE: Número de empresas del sector privado en Setiembre 2021
OCTUBRE: Número de empresas del sector privado en Octubre 2021
NOVIEMBRE: Número de empresas del sector privado en Noviembre 2021
DICIEMBRE: Número de empresas del sector privado en Diciembre 2021
# A tibble: 16,428 x 4
UBIGEO DISTRITOS MES NUMEROEMPRESAS
<chr> <chr> <chr> <dbl>
1 010101 CHACHAPOYAS Enero 504
2 010101 CHACHAPOYAS Febrero 490
3 010101 CHACHAPOYAS Marzo 510
4 010101 CHACHAPOYAS Abril 513
5 010101 CHACHAPOYAS Mayo 516
6 010101 CHACHAPOYAS Junio 531
7 010101 CHACHAPOYAS Julio 541
8 010101 CHACHAPOYAS Agosto 553
9 010101 CHACHAPOYAS Setiembre 550
10 010101 CHACHAPOYAS Octubre 560
# ... with 16,418 more rows
sf [1,874 x 78] (S3: sf/tbl_df/tbl/data.frame)
$ UBIGEO : chr [1:1874] "100902" "100904" "250305" "250302" ...
$ OBJECTID : num [1:1874] 1 2 3 4 5 6 7 8 9 10 ...
$ NOMBDEP : chr [1:1874] "HUANUCO" "HUANUCO" "UCAYALI" "UCAYALI" ...
$ NOMBPROV : chr [1:1874] "PUERTO INCA" "PUERTO INCA" "PADRE ABAD" "PADRE ABAD" ...
$ NOMBDIST : chr [1:1874] "CODO DEL POZUZO" "TOURNAVISTA" "ALEXANDER VON HUMBOLDT" "IRAZOLA" ...
$ CAPITAL : chr [1:1874] "CODO DEL POZUZO" "TOURNAVISTA" "ALEXANDER VON HUMBOLDT" "SAN ALEJANDRO" ...
$ POBTOTAL : num [1:1874] 7768 6219 6085 10941 9003 ...
$ POB_EDAD_T: num [1:1874] 5022 4162 4172 7308 5983 ...
$ POB_EDAD_E: num [1:1874] 4329 3577 3616 6368 5058 ...
$ DENSIDAD : num [1:1874] 2.34 2.79 31.89 10.95 15.54 ...
$ POBMASCU : num [1:1874] 4312 3490 3210 5670 4756 ...
$ POBFEMEN : num [1:1874] 3456 2729 2875 5271 4247 ...
$ POBMASCU_P: num [1:1874] 55.5 56.1 52.8 51.8 52.8 ...
$ POBFEMEN_P: num [1:1874] 44.5 43.9 47.2 48.2 47.2 ...
$ R_MASCULIN: num [1:1874] 125 128 112 108 112 ...
$ POBURBANA : num [1:1874] 2398 1495 4564 6922 4518 ...
$ POBRURAL : num [1:1874] 5370 4724 1521 4019 4485 ...
$ POBURBANA_: num [1:1874] 30.9 24 75 63.3 50.2 ...
$ POBRURAL_P: num [1:1874] 69.1 76 25 36.7 49.8 ...
$ EDAD_PROME: num [1:1874] 25.5 26.9 27.3 25.8 26.3 ...
$ POB_0_14 : num [1:1874] 2872 2162 2055 3866 3222 ...
$ POB_15_29 : num [1:1874] 1888 1496 1508 2830 2236 ...
$ POB_30_59 : num [1:1874] 2575 2125 2134 3713 2951 ...
$ POB_60_MAS: num [1:1874] 432 435 388 532 594 ...
$ VIV_PARTIC: num [1:1874] 2498 1683 1849 3820 2349 ...
$ VIV_PART_1: num [1:1874] 1961 1397 1251 2491 1882 ...
$ HOGARES : num [1:1874] 1979 1407 1295 2563 1925 ...
$ Shape_Leng: num [1:1874] 2.417 2.578 0.702 2.456 1.441 ...
$ Shape_Area: num [1:1874] 0.2655 0.1432 0.0169 0.1543 0.0513 ...
$ DIRECCION : chr [1:1874] "CODO DEL POZUZO,PUERTO INCA,HUANUCO" "TOURNAVISTA,PUERTO INCA,HUANUCO" "ALEXANDER VON HUMBOLDT,PADRE ABAD,UCAYALI" "IRAZOLA,PADRE ABAD,UCAYALI" ...
$ POB_PROYEC: num [1:1874] 8248 6543 6159 12065 10501 ...
$ POB_EDAD_1: num [1:1874] 64.6 66.9 68.6 66.8 66.5 ...
$ POB_EDAD_2: num [1:1874] 55.7 57.5 59.4 58.2 56.2 ...
$ EDAD_MEDIA: num [1:1874] 23 24 24 23 23 24 23 23 22 24 ...
$ POB_0_14_P: num [1:1874] 37 34.8 33.8 35.3 35.8 ...
$ POB_15_29_: num [1:1874] 24.3 24.1 24.8 25.9 24.8 ...
$ POB_30_59_: num [1:1874] 33.1 34.2 35.1 33.9 32.8 ...
$ POB_60_M_1: num [1:1874] 5.56 6.99 6.38 4.86 6.6 ...
$ POB_ANALFA: num [1:1874] 518 318 394 760 317 ...
$ POB_ANAL_1: num [1:1874] 10.57 7.84 9.78 10.74 5.48 ...
$ HOMBRES_AN: num [1:1874] 173.4 94.5 122.4 248.4 101.5 ...
$ HOMBRES__1: num [1:1874] 6.16 3.94 5.72 6.68 3.26 ...
$ MUJERES_AN: num [1:1874] 344 224 272 511 216 ...
$ MUJERES__1: num [1:1874] 16.55 13.5 14.37 15.25 8.07 ...
$ MUJERES_ED: num [1:1874] 1700 1310 1491 2749 2118 ...
$ MUJERES__2: num [1:1874] 49.2 48 51.9 52.1 49.9 ...
$ TOTAL_MADR: num [1:1874] 1785 1372 1539 2553 2175 ...
$ MADRES_SOL: num [1:1874] 103 101 168 238 148 894 177 177 90 482 ...
$ MADRES_S_1: num [1:1874] 5.77 7.36 10.92 9.32 6.8 ...
$ MUJERES_AD: num [1:1874] 478 449 406 821 685 ...
$ MADRES_ADO: num [1:1874] 101 77 67 107 107 348 104 110 72 167 ...
$ MADRES_A_1: num [1:1874] 21.1 17.1 16.5 13 15.6 ...
$ AL_MENOS_1: num [1:1874] 476 451 573 836 717 ...
$ AL_MENOS_2: num [1:1874] 6.13 7.25 9.42 7.64 7.96 ...
$ SIN_DISCAP: num [1:1874] 7292 5768 5512 10105 8286 ...
$ SIN_DISC_1: num [1:1874] 93.9 92.7 90.6 92.4 92 ...
$ ALGUNA_NBI: num [1:1874] 62.6 54.5 55.1 59.2 60.5 ...
$ NBI_PORC : num [1:1874] 37.4 45.5 44.9 40.8 39.5 ...
$ VIV_PART_2: num [1:1874] 78.5 83 67.7 65.2 80.1 ...
$ IC_INF : num [1:1874] 15.23 18.07 8.12 8.12 7.58 ...
$ IC_SUP : num [1:1874] 39.2 35.3 17.7 17.7 16.3 ...
$ UBIC_POBMO: num [1:1874] 1181 1192 1657 1656 1680 ...
$ TOTAL_DEFU: num [1:1874] 5 3 0 10 3 16 6 15 6 16 ...
$ TOTAL_DE_1: num [1:1874] 5 5 3 15 16 34 10 15 7 35 ...
$ TOTAL_DE_2: num [1:1874] 10 8 3 25 19 50 16 30 13 51 ...
$ NAC_BAJOPE: num [1:1874] 4.33 4.58 3.7 3.08 0 ...
$ NAC_BAJO_1: num [1:1874] 9 6 3 10 0 27 18 13 9 18 ...
$ MUJERES_NA: num [1:1874] 46.2 48.1 49.4 48 0 ...
$ MUJERES__3: num [1:1874] 96 63 40 156 0 360 104 127 65 159 ...
$ HOMBRES_NA: num [1:1874] 53.8 51.9 50.6 52 0 ...
$ HOMBRES__2: num [1:1874] 112 68 41 169 0 361 106 163 71 181 ...
$ TOTAL_NACI: num [1:1874] 208 131 81 325 0 721 210 290 136 340 ...
$ IND_121951: num [1:1874] 37 35 53 176 60 277 120 81 43 86 ...
$ IND_122042: num [1:1874] 11868 7747 3893 11691 7432 ...
$ IND_122047: num [1:1874] 9470 6279 3317 11225 6835 ...
$ IND_516462: num [1:1874] 75000 13500 43950 125760 237441 ...
$ IND_516484: num [1:1874] 730 1236 540 1366 691 ...
$ geometry :sfc_MULTIPOLYGON of length 1874; first list element: List of 1
..$ :List of 1
.. ..$ : num [1:1294, 1:2] -75.3 -75.3 -75.3 -75.3 -75.3 ...
..- attr(*, "class")= chr [1:3] "XY" "MULTIPOLYGON" "sfg"
- attr(*, "sf_column")= chr "geometry"
- attr(*, "agr")= Factor w/ 3 levels "constant","aggregate",..: NA NA NA NA NA NA NA NA NA NA ...
..- attr(*, "names")= chr [1:77] "UBIGEO" "OBJECTID" "NOMBDEP" "NOMBPROV" ...
| UBIGEO | DISTRITOS | MES | NUMEROEMPRESAS | PERIODO | DEPARTAMENTO | PROVINCIA | DISTRITO | |
|---|---|---|---|---|---|---|---|---|
| Length:16416 | Length:16416 | Length:16416 | Min. : 0.0 | Min. :202101 | Length:16416 | Length:16416 | Length:16416 | |
| Class :character | Class :character | Class :character | 1st Qu.: 1.0 | 1st Qu.:202104 | Class :character | Class :character | Class :character | |
| Mode :character | Mode :character | Mode :character | Median : 5.0 | Median :202107 | Mode :character | Mode :character | Mode :character | |
| NA | NA | NA | Mean : 229.5 | Mean :202107 | NA | NA | NA | |
| NA | NA | NA | 3rd Qu.: 38.0 | 3rd Qu.:202109 | NA | NA | NA | |
| NA | NA | NA | Max. :15744.0 | Max. :202112 | NA | NA | NA |
tibble [16,416 x 8] (S3: tbl_df/tbl/data.frame)
$ UBIGEO : chr [1:16416] "010101" "010101" "010101" "010101" ...
$ DISTRITOS : chr [1:16416] "CHACHAPOYAS" "CHACHAPOYAS" "CHACHAPOYAS" "CHACHAPOYAS" ...
$ MES : chr [1:16416] "Enero" "Febrero" "Marzo" "Abril" ...
$ NUMEROEMPRESAS: num [1:16416] 504 490 510 513 516 531 541 553 550 560 ...
$ PERIODO : num [1:16416] 202101 202102 202103 202104 202105 ...
$ DEPARTAMENTO : chr [1:16416] "AMAZONAS" "AMAZONAS" "AMAZONAS" "AMAZONAS" ...
$ PROVINCIA : chr [1:16416] "CHACHAPOYAS" "CHACHAPOYAS" "CHACHAPOYAS" "CHACHAPOYAS" ...
$ DISTRITO : chr [1:16416] "CHACHAPOYAS" "CHACHAPOYAS" "CHACHAPOYAS" "CHACHAPOYAS" ...
NULL
---
title: Dashboard Empresas Sector Privado Desarrollado por Angel Salomon Rodriguez Naola
output:
flexdashboard::flex_dashboard:
theme: sandstone
social: menu
source_code: embed
orientation: columns
vertical_layout: fill
---
```{r setup, include=FALSE}
library(tidyverse)
library(grid)
library(gridExtra)
library(sf)
library(readxl)
library(ggrepel)
library(readr)
library(ggplot2)
library(ggalt)
library(dslabs)
library(CGPfunctions)
library(flexdashboard)
library(yaml)
library(knitr)
require(plotly)
library(ggplot2)
require(gganimate)
require(esquisse)
require(gapminder)
library(ggplot2)
library(kableExtra)
library(animation)
```
**Descripción de la base**
=======================================================================
Column {data-width=500}
-----------------------------------------------------------------------
### **Descripción**
- Información Estadística de número de empresas del sector privado distribuidos por distritos mensualmente en el año 2021.
- Fuente: Superintendencia Nacional de Aduanas y de Administración Tributaria (SUNAT)
- El marco principal de datos de dicha información tiene 1369 filas y 14 variables:
- **Ubigeo**: factor con 1369 niveles
- **DISTRITOS**: factor con 1369 niveles
- **ENERO**: Número de empresas del sector privado en Enero 2021
- **FEBRERO**: Número de empresas del sector privado en Febrero 2021
- **MARZO**: Número de empresas del sector privado en Marzo 2021
- **ABRIL**: Número de empresas del sector privado en Abril 2021
- **MAYO**: Número de empresas del sector privado en Mayo 2021
- **JUNIO**: Número de empresas del sector privado en Junio 2021
- **JULIO**: Número de empresas del sector privado en Julio 2021
- **AGOSTO**: Número de empresas del sector privado en Agosto 2021
- **SETIEMBRE**: Número de empresas del sector privado en Setiembre 2021
- **OCTUBRE**: Número de empresas del sector privado en Octubre 2021
- **NOVIEMBRE**: Número de empresas del sector privado en Noviembre 2021
- **DICIEMBRE**: Número de empresas del sector privado en Diciembre 2021
Column {data-width=500}
-----------------------------------------------------------------------
### **Resumen**
```{r}
setwd("~/ANGEL RODRIGUEZ/CURSO ANALITICA DE DATOS Y GEOREFERENCIACION CON R UNI/EXAMEN FINAL")
options(scipen = 999)
#Cargando la base de Datos
df <- read_csv("Empresas sector privado por mes Segun Distritos 2021.csv")
# Renombrando Columnas
df<-rename(df, UBIGEO = `Código de Ubigeo`)
#Eliminando Espacios en los campos numericos
dfn <-as.data.frame(apply(df,2,function(x) str_replace_all(string=x,pattern=" ", repl="")))
# Pivoteando el dataframe df
dft <- dfn %>%
pivot_longer(cols = Enero:Diciembre,
names_to = "MES",
values_to = "NUMEROEMPRESAS" )
#Cambiando de formato caracter a numerico
dft$NUMEROEMPRESAS<-as.numeric(dft$NUMEROEMPRESAS)
#Asignando valores NA a cero
dft[is.na(dft)] <- 0
dft
# Recodificando los meses en Periodo del año 2021
dft$PERIODO[dft$MES =="Enero"] <-202101
dft$PERIODO[dft$MES =="Febrero"] <-202102
dft$PERIODO[dft$MES =="Marzo"] <-202103
dft$PERIODO[dft$MES =="Abril"] <-202104
dft$PERIODO[dft$MES =="Mayo"] <-202105
dft$PERIODO[dft$MES =="Junio"] <-202106
dft$PERIODO[dft$MES =="Julio"] <-202107
dft$PERIODO[dft$MES =="Agosto"] <-202108
dft$PERIODO[dft$MES =="Setiembre"] <-202109
dft$PERIODO[dft$MES =="Octubre"] <-202110
dft$PERIODO[dft$MES =="Noviembre"] <-202111
dft$PERIODO[dft$MES =="Diciembre"] <-202112
# Carguemos el mapa
distrital <- read_sf("mapasDsto/DISTRITOS_inei_geogpsperu_suyopomalia.shp")
str(distrital)
# Uniendo el Departamento y Provincia
dft$DEPARTAMENTO <- distrital$NOMBDEP[ match(dft$UBIGEO, distrital$UBIGEO) ]
dft$PROVINCIA <- distrital$NOMBPROV[ match(dft$UBIGEO, distrital$UBIGEO) ]
dft$DISTRITO <- distrital$NOMBDIST[ match(dft$UBIGEO, distrital$UBIGEO) ]
#Eliminando los NA's
dft <- dft[!is.na(dft$DEPARTAMENTO),]
#Resumen de los datos
resumen <- summary(dft)
kable(resumen) %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed"))
```
### **Estructura**
```{r}
st <- str(dft)
st
```
**Evolutivo de Empresas Privadas en Regiones del Perú - 2021 **
============================================================================
Row
----------------------------------------------------------------------------
### **Evolutivo Número de Empresas Región Lima vs Región Norte**
```{r}
#Agrupando por Departamento
dep<-dft %>%
group_by(DEPARTAMENTO,PERIODO) %>%
summarise(NUMEROEMPRESAS=sum(NUMEROEMPRESAS))
dep$PERIODO=as.character(dep$PERIODO)
#distLimaCallao<-as.data.frame(distLimaCallao)
depLimaNorte <- c("ANCASH","CAJAMARCA","CALLAO","LA LIBERTAD","LAMBAYEQUE","LIMA","PIURA","TUMBES")
labels <- data.frame(DEPARTAMENTO = depLimaNorte, x = c(2,3,4,5,6,7,8,11), y = c(8500, 6500,11200,12900,18900,172000,11000,30))
p<-dep %>% filter(DEPARTAMENTO %in% depLimaNorte) %>%
ggplot(aes(PERIODO, NUMEROEMPRESAS, col = DEPARTAMENTO,group=DEPARTAMENTO)) +
geom_line() +
geom_text(data = labels, aes(x, y, label = DEPARTAMENTO), size = 4) +
theme(legend.position = "none")
ggplotly(p)
```
### **Evolutivo Número de Empresas Región Lima vs Región Centro**
```{r}
#Evolutivo Numero de Empresas Región Lima vs Región Centro
depLimaCentro <- c("CALLAO","JUNIN", "HUANCAVELICA","HUANUCO","LIMA","PASCO")
labels <- data.frame(DEPARTAMENTO = depLimaCentro, x = c(2,4,6,8,10,12), y = c(12050, 10000, 30,8000,171900,1870))
q<-dep %>% filter(DEPARTAMENTO %in% depLimaCentro) %>%
ggplot(aes(PERIODO, NUMEROEMPRESAS, col = DEPARTAMENTO,group=DEPARTAMENTO)) +
geom_line() +
geom_text(data = labels, aes(x, y, label = DEPARTAMENTO), size = 4) +
theme(legend.position = "none")
ggplotly(q)
```
Row
-----------------------------------------------------------------------
### **Evolutivo Número de Empresas Región Lima vs Región Sur**
```{r}
#Evolutivo Numero de Empresas Región Lima vs Región Sur
depLimaSur <- c("APURIMAC","AREQUIPA","AYACUCHO","CALLAO","CUSCO", "ICA","LIMA","MOQUEGUA","PUNO","TACNA")
labels <- data.frame(DEPARTAMENTO = depLimaSur, x = c(2,3,4,5,6,7,8,9,11,12), y = c(250, 24000,300,12000,9800,9550,175000,250,2200,1800))
r<-dep %>% filter(DEPARTAMENTO %in% depLimaSur) %>%
ggplot(aes(PERIODO, NUMEROEMPRESAS, col = DEPARTAMENTO,group=DEPARTAMENTO)) +
geom_line() +
geom_text(data = labels, aes(x, y, label = DEPARTAMENTO), size = 4) +
theme(legend.position = "none")
ggplotly(r)
```
### **Evolutivo Número de Empresas Región Lima vs Región Oriente**
```{r}
#Evolutivo Numero de Empresas Región Lima vs Región Oriente
depLimaOriente <- c("AMAZONAS","CALLAO","LIMA", "LORETO","MADRE DE DIOS","SAN MARTIN","UCAYALI")
labels <- data.frame(DEPARTAMENTO = depLimaOriente, x = c(2,4,6,8,10,11,12), y = c(250, 12300, 172000,6000,4000,8150,2500))
s<-dep %>% filter(DEPARTAMENTO %in% depLimaOriente) %>%
ggplot(aes(PERIODO, NUMEROEMPRESAS, col = DEPARTAMENTO,group=DEPARTAMENTO)) +
geom_line() +
geom_text(data = labels, aes(x, y, label = DEPARTAMENTO), size = 4) +
theme(legend.position = "none")
ggplotly(s)
```
**Distribución de Empresas Privadas en Distritos de Lima Metropolitana y Callao - 2021 **
============================================================================
Row
----------------------------------------------------------------------------
### **Distribución de Número de Empresas por Distritos de Lima Metropolitana y Callao**
```{r}
LimaMetrop <- dft %>%
filter((DEPARTAMENTO == "LIMA" | DEPARTAMENTO=="CALLAO") & (PROVINCIA =="LIMA" | PROVINCIA=="CALLAO") )
LimaMetrop$PERIODO=as.character(LimaMetrop$PERIODO)
# Grafico de Numero de Empresas por Periodo, por Cada Dsitrito de Lima Metropolitana
t<-ggplot(LimaMetrop, aes(x=PERIODO, y = NUMEROEMPRESAS,group=1)) +
geom_line(color="grey") +
geom_point(color="blue") +
facet_wrap(~DISTRITO) +
theme_minimal(base_size = 10) +
theme(axis.text.x = element_text(angle = 90,hjust=1)) +
labs(title = "Número de Empresas por Distritos de Lima Metropolitana",
x = "Periodo",
y = "Numero de Empresas")
ggplotly(t)
```
**Distribución de Empresas Privadas en Zonas de Lima Metropolitana y Callao - 2021 **
============================================================================
Row
----------------------------------------------------------------------------
### **Diagrama de Cajas por Zonas de Lima Metropolitana y Callao**
```{r}
# Cargando Los Distritos de Lima y Callao
LimaMetPer <- dft %>%
filter((DEPARTAMENTO == "LIMA" | DEPARTAMENTO=="CALLAO") & (PROVINCIA =="LIMA" | PROVINCIA=="CALLAO") )
# Recodificación de Distritos de Lima y Callao por Zonas
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="BREÑA"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="JESUS MARIA"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LA VICTORIA"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="RIMAC"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LINCE"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="MAGDALENA DEL MAR"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="MIRAFLORES"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="PUEBLO LIBRE"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SAN BORJA"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SAN ISIDRO"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="BARRANCO"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SAN MIGUEL"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SANTIAGO DE SURCO"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SURQUILLO"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LIMA"] <-"LIMA CENTRO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="ANCON"] <-"LIMA NORTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="CARABAYLLO"] <-"LIMA NORTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="COMAS"] <-"LIMA NORTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="INDEPENDENCIA"] <-"LIMA NORTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LOS OLIVOS"] <-"LIMA NORTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="PUENTE PIEDRA"] <-"LIMA NORTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SAN MARTIN DE PORRES"] <-"LIMA NORTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SANTA ROSA"] <-"LIMA NORTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="ATE"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="CHACLACAYO"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="CIENEGUILLA"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="EL AGUSTINO"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LA MOLINA"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LURIGANCHO"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SAN JUAN DE LURIGANCHO"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SAN LUIS"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SANTA ANITA"] <-"LIMA ESTE"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="CHORRILLOS"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LURIN"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="PACHACAMAC"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="PUCUSANA"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="PUNTA HERMOSA"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="PUNTA NEGRA"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SAN BARTOLO"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SAN JUAN DE MIRAFLORES"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="SANTA MARIA DEL MAR"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="VILLA EL SALVADOR"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="VILLA MARIA DEL TRIUNFO"] <-"LIMA SUR"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="BELLAVISTA"] <-"CALLAO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="CALLAO"] <-"CALLAO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="CARMEN DE LA LEGUA REYNOSO"] <-"CALLAO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LA PERLA"] <-"CALLAO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="LA PUNTA"] <-"CALLAO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="MI PERU"] <-"CALLAO"
LimaMetPer$ZONA[LimaMetPer$DISTRITO =="VENTANILLA"] <-"CALLAO"
# Resumiendo por Zonas y Distritos
distLimaPer<-LimaMetPer %>%
group_by(ZONA,DISTRITO,PERIODO) %>%
summarise(NUMEROEMPRESAS=sum(NUMEROEMPRESAS))
# Grafico de Boxplot por Zonas de Lima Metropolitana y Callao
p <- ggplot(distLimaPer, aes(x=ZONA, y=NUMEROEMPRESAS, fill=ZONA, color=ZONA)) +
geom_boxplot(alpha=0.3)+
labs(y = "Número de Empresas", x = "") +
ggtitle('Diagrama de Cajas por Zonas')
ggplotly(p)
```
### **Histograma de Número de Empresas por Zonas de Lima Metropolitana y Callao**
```{r}
k <- ggplot(distLimaPer, aes(x=NUMEROEMPRESAS))+
geom_histogram(fill='lightseagreen', color="lightseagreen", alpha=0.5)+
ggtitle('Histograma del Numero de Empresas')+
labs(y = "Cantidad", x = "Número de Empresas")
ggplotly(k)
```
Row
-----------------------------------------------------------------------
### **Distribución de Empresas Privadas por Zonas de Lima Metropolitana y Callao**
```{r}
j <- ggplot(distLimaPer, aes(x=ZONA)) + geom_bar(fill=c('lightseagreen','lightskyblue','lightskyblue1',
'lightskyblue2', 'lightskyblue3')) +
ggtitle('Distribución por Zonas') +
labs(y = "Cantidad", x = "")
ggplotly(j)
```
### **Densidad de Empresas Privadas por Zonas de Lima Metropolitana y Callao**
```{r}
m <- ggplot(distLimaPer, aes(x=NUMEROEMPRESAS, colour=ZONA, fill=ZONA))+
geom_density(alpha=0.4) +
ggtitle('Densidad por Zonas') +
labs(y = "Densidad", x = "Número de Empresas")
ggplotly(m)
```